从三明治聊聊数据分析中的综合评价模型

戳我 -> 卧槽!当当网图书全场4折了!

作者:Rain0808

来源:DS数据科学之美

一、写在前面

    上周做的早餐三明治, 特地买了全网最红的早餐机, 准备了材料: 香肠, 鸡蛋, 黄瓜, 鸡胸肉(发现鸡胸肉加玉米生粉以后会再去煎会异常的香), 按照步骤, 煎鸡蛋, 煎香肠, 煎鸡胸肉, 然后上吐司(牛奶口味滴, 异常香甜), 剪了完整的一个视频, 真的很费时间, 在此鸣谢手机和某剪辑软件hhhh, 煎好的时候, 从来没有想过可以这么好吃

    但是因为去评价这个三明治是否是色香味俱全滴, 不能自吹自擂是吧, 我就在想能不能把互联网的一些评价的方法运用起来, 去科学的评价这个三明治做的怎么样。

   直观来说, 这个三明治做的怎么样, 是一个综合的评价问题, 因为你得从他做出来的形状颜色好看不好看是吧(卖相), 除了好看不好看, 你还得看他是否好吃是吧(味道), 从了好看, 好吃, 还得看这个三明治的 营养价值, 比如热量不能太高是吧, 脂肪不能太高是吧, 蛋白质又得尽量高一点, 还得包含维生素等等全面的营养价值

   所以我们的问题就变成了 从卖相, 味道, 热量, 脂肪, 蛋白质, 维生素等去评价这个三明治是否是色香味俱全的全网最秀的三明治hhhhh, 但是我们不知道这几个评价的因素哪一个更重要一点, 哪一个稍微没那么重要一点, 所以我们得计算每一个因素的权重, 然后计算一个综合的得分, 整体的分析思路如下

    

    权重的计算主要采用熵权法来计算。

二、熵权法基本原理

    在信息论中,熵是对不确定性的一种度量。不确定性越大,熵就越大,包含的信息量越大;不确定性越小,熵就越小,包含的信息量就越小。

    根据熵的特性,可以通过计算熵值来判断一个事件的随机性及无序程度,也可以用熵值来判断某个指标的离散程度,指标的离散程度越大,该指标对综合评价的影响(权重)越大。比如样本数据在某指标下取值都相等,则该指标对总体评价的影响为0,权值为0.

    熵权法是一种客观赋权法,因为它仅依赖于数据本身的离散性, 所以我们可以用熵权法来计算三明治各个评价因素的权重, 然后再计算总得分

三、熵权法步骤

  我们假如有一个虚拟的数据如下: 表格中的数字是评分

1. 指标定义:

对  个样本,  个指标,则  为第  个样本的第  个指标的数值(  ); 比如这里 x13 表示第一个样本的第三个指标的数据也就是 三明治1 的脂肪数据 也就是8 

2. 指标的归一化处理:异质指标同质化

由于各项指标的计量单位并不统一,因此在用它们计算综合指标前,先要进行标准化处理,即把指标的绝对值转化为相对值,从而解决各项不同质指标值的同质化问题。

另外,正向指标和负向指标数值代表的含义不同(正向指标数值越高越好,负向指标数值越低越好),因此,对于正向负向指标需要采用不同的算法进行数据标准化处理:

为了方便起见,归一化后的数据  仍记为  ;

3. 计算第  项指标下第  个样本值占该指标的比重:

拿第三个指标下第一个样本举例: 第三个指标是脂肪第一个样本的值是8, 这就是分子, 分母是第三个指标所在的列求和就是(8+3+5+2+2), 

那这个值就是8/20 = 0.4

4. 计算第  项指标的熵值:

其中, . 满足  ;

这里的n 就是样本数 5 

5. 计算信息熵冗余度(差异):

6. 计算各项指标的权重:

7. 计算各样本的综合得分:

其中,  为标准化后的数据

假如计算出来的权重 分别是 0.5, 0.3, 0.2, 0.3, 0.4

综合得分就变成 三明治1 = 0.5 * 3+ 0.3*6 + 0.2*8 + 0.3*7 + 0.4*2 

◆ ◆ ◆  ◆ ◆

号主新书相信可以帮助到大家入门数据分析,我写了本书:《拿下Offer-数据分析师求职面试指南》,恰逢当当网开学季活动,卧槽!当当网图书全场4折了!,详情如下:

当当网开学季活动来袭,满100减50的基础上,实付满200的基础上使用优惠码DYU6NM可以再减40,相当于400-240,

使用方法如下:

步骤一,挑选心仪的图书至购物车点击结算 

步骤二,点击优惠券/码处

步骤三,输入优惠码DYU6NM (注意全部要大写)

需要注意的是:优惠码全场自营图书可用(教材、考试类除外)

                           

更多详情可以扫描下方二维码:

点击阅读原文,即可参与当当400-240购书活动
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值